智能论文笔记

Assistive Tele-op: Leveraging Transformers to Collect Robotic Task Demonstrations

Henry M. Clever , Ankur Handa , Hammad Mazhar , Kevin Parker , Omer Shapira , Qian Wan , Yashraj Narang , Iretiayo Akinola , Maya Cakmak , Dieter Fox

分类：机器人

2021-12-09

在机器人和人类运营商之间分享自主权可以促进机器人任务示范的数据收集，以不断改进学习模型。然而，沟通意图的手段和关于未来的原因是人类和机器人之间的差异。我们介绍了辅助Tele-Op，虚拟现实（VR）系统，用于收集展示自主轨迹预测的机器人任务演示，以传达机器人的意图。随着机器人移动，用户可以在需要时切换自主和手动控制。这允许用户通过高成功率和比手动遥操作系统更轻松地收集任务演示。我们的系统由变压器供电，可以为未来提供潜在的状态和行动的窗口 - 几乎没有添加计算时间。密钥识别是，如果用户决定模型预测的操作是不合适的，则可以在变换器序列内的任何位置注入人类意图。在每次步骤中，用户可以（1）无所作为并允许自主操作在观察机器人的未来计划序列时继续，或者（2）接管并暂时规定不同一组动作以使模型返回到轨道上。我们在https://sites.google.com/view/assistive-teleop上托管视频和其他补充材料。

translated by 谷歌翻译

Biomedical image analysis competitions: The state of current participation practice

Matthias Eisenmann , Annika Reinke , Vivienn Weru , Minu Dietlinde Tizabi , Fabian Isensee , Tim J. Adler , Patrick Godau , Veronika Cheplygina , Michal Kozubek , Sharib Ali

分类：计算机视觉 | 机器学习

2022-12-16

The number of international benchmarking competitions is steadily increasing in various fields of machine learning (ML) research and practice. So far, however, little is known about the common practice as well as bottlenecks faced by the community in tackling the research questions posed. To shed light on the status quo of algorithm development in the specific field of biomedical imaging analysis, we designed an international survey that was issued to all participants of challenges conducted in conjunction with the IEEE ISBI 2021 and MICCAI 2021 conferences (80 competitions in total). The survey covered participants' expertise and working environments, their chosen strategies, as well as algorithm characteristics. A median of 72% challenge participants took part in the survey. According to our results, knowledge exchange was the primary incentive (70%) for participation, while the reception of prize money played only a minor role (16%). While a median of 80 working hours was spent on method development, a large portion of participants stated that they did not have enough time for method development (32%). 25% perceived the infrastructure to be a bottleneck. Overall, 94% of all solutions were deep learning-based. Of these, 84% were based on standard architectures. 43% of the respondents reported that the data samples (e.g., images) were too large to be processed at once. This was most commonly addressed by patch-based training (69%), downsampling (37%), and solving 3D analysis tasks as a series of 2D tasks. K-fold cross-validation on the training set was performed by only 37% of the participants and only 50% of the participants performed ensembling based on multiple identical models (61%) or heterogeneous models (39%). 48% of the respondents applied postprocessing steps.

translated by 谷歌翻译

R2C-GAN: Restore-to-Classify GANs for Blind X-Ray Restoration and COVID-19 Classification

Mete Ahishali , Aysen Degerli , Serkan Kiranyaz , Tahir Hamid , Rashid Mazhar , Moncef Gabbouj

分类：计算机视觉 | 机器学习

2022-09-29

恢复质量差的图像与一组混合伪影对于可靠的诊断起着至关重要的作用。现有的研究集中在特定的恢复问题上，例如图像过度，去核和暴露校正，通常对伪影类型和严重性有很强的假设。作为盲X射线恢复的先驱研究，我们提出了一个通用图像恢复和分类的联合模型：恢复分类为分类的生成对抗网络（R2C-GAN）。这种共同优化的模型使恢复后保持任何疾病完整。因此，由于X射线图像质量的提高，这自然会导致更高的诊断性能。为了实现这一关键目标，我们将恢复任务定义为图像到图像的翻译问题，从差异，模糊或暴露不足/暴露不足的图像到高质量的图像域。提出的R2C-GAN模型能够使用未配对的训练样本在两个域之间学习前进和逆变换。同时，联合分类在恢复过程中保留了疾病标签。此外，R2C-GAN配备了操作层/神经元，可降低网络深度，并进一步增强恢复和分类性能。拟议的联合模型对2019年冠状病毒病（COVID-19）分类的卡塔-COV19数据集进行了广泛的评估。拟议的恢复方法达到了90％以上的F1得分，这显着高于任何深层模型的性能。此外，在定性分析中，R2C-GAN的恢复性能得到了一群医生的批准。我们在https://github.com/meteahishali/r2c-gan上共享软件实施。

translated by 谷歌翻译

Transformer-based Value Function Decomposition for Cooperative Multi-agent Reinforcement Learning in StarCraft

Muhammad Junaid Khan , Syed Hammad Ahmed , Gita Sukthankar

分类：机器学习

2022-08-15

Starcraft II多代理挑战（SMAC）被创建为合作多代理增强学习（MARL）的具有挑战性的基准问题。 SMAC专注于星际争霸微管理的问题，并假设每个单元都由独立行动并仅具有本地信息的学习代理人单独控制；假定通过分散执行（CTDE）进行集中培训。为了在SMAC中表现良好，MARL算法必须处理多机构信贷分配和联合行动评估的双重问题。本文介绍了一种新的体系结构Transmix，这是一个基于变压器的联合行动值混合网络，与其他最先进的合作MARL解决方案相比，我们显示出高效且可扩展的。 Transmix利用变形金刚学习更丰富的混合功能的能力来结合代理的个人价值函数。它与以前的SMAC场景上的工作相当，并且在困难场景上胜过其他技术，以及被高斯噪音损坏的场景以模拟战争的雾。

translated by 谷歌翻译

Using Adaptive Experiments to Rapidly Help Students

Angela Zavaleta-Bernuy , Qi Yin Zheng , Hammad Shaikh , Jacob Nogas , Anna Rafferty , Andrew Petersen , Joseph Jay Williams

分类：机器学习

2022-08-10

自适应实验可以增加当前学生从教学干预的现场实验中获得更好结果的机会。在此类实验中，在收集更多数据时将学生分配到条件变化的可能性，因此可以将学生分配给可能表现更好的干预措施。数字教育环境降低了进行此类适应性实验的障碍，但很少在教育中应用。原因之一可能是研究人员可以访问很少的现实案例研究，这些案例研究说明了在特定情况下这些实验的优势和缺点。我们通过使用Thompson采样算法进行自适应实验来评估学生在学生中提醒的效果，并将其与传统的统一随机实验进行比较。我们将其作为有关如何进行此类实验的案例研究，并提出了有关自适应随机实验可能或多或少有用的条件的一系列开放问题。

translated by 谷歌翻译

Exploration of Parameter Spaces Assisted by Machine Learning

A. Hammad , Myeonghun Park , Raymundo Ramos , Pankaj Saha

分类：机器学习

2022-07-20

我们展示了各种功能和类，可以通过改进机器学习协助的参数空间进行采样过程。特别注意设置理智默认值的目标是，不同问题要求的调整仍然很小。从查找参数空间的界限到在感兴趣的领域中积累样本的界限，可以使用此例程集来进行不同类型的分析。特别是，我们讨论了通过合并不同的机器学习模型来帮助的两种方法：回归和分类。我们表明，机器学习分类器可以为探索参数空间提供更高的效率。此外，我们引入了一种提升技术，以改善过程开始时的缓慢收敛性。在一些示例的帮助下，更好地解释了这些例程的使用，这些示例说明了人们可以获得的结果类型。我们还包括用于获取示例的代码的示例，以及可以对调整计算适应其他问题的调整的描述。我们通过在探索与测得的HigGS玻色子信号强度匹配的两个HIGGS DoubleT模型的参数空间时显示这些技术的影响来最终确定。本文使用的代码和有关如何使用它的说明可在网络上可用。

translated by 谷歌翻译

SeLoC-ML: Semantic Low-Code Engineering for Machine Learning Applications in Industrial IoT

Haoyu Ren , Kirill Dorofeev , Darko Anicic , Youssef Hammad , Roland Eckl , Thomas A. Runkler

分类：人工智能 | 机器学习

2022-07-18

物联网（物联网）正在通过弥合信息技术（IT）和运营技术（OT）之间的差距来改变行业。机器正在与连接的传感器集成在一起，并通过智能分析应用程序管理，加速了数字化转型和业务运营。将机器学习（ML）带到工业设备是一个进步，旨在促进IT和OT的融合。但是，在工业物联网（IIOT）中开发ML应用程序提出了各种挑战，包括硬件异质性，ML模型的非标准化表示，设备和ML模型兼容性问题以及慢速应用程序开发。在这一领域的成功部署需要深入了解硬件，算法，软件工具和应用程序。因此，本文介绍了一个名为ML应用程序的名为“语义低代码工程”（SELOC-ML），该框架建立在低代码平台上，以利用语义Web技术来支持IIOT的ML应用程序的快速开发。 SELOC-ML使非专家能够轻松地模拟，发现，重复使用和对接ML模型和设备。可以根据匹配结果自动生成项目代码在硬件上部署。开发人员可以从称为食谱的语义应用模板中受益，从而快速原型最终用户应用程序。与工业ML分类案例研究中的传统方法相比，评估证实了至少三倍的工程努力，显示了SELOC-ML的效率和实用性。我们分享代码并欢迎任何贡献。

translated by 谷歌翻译

Drift Reduction for Monocular Visual Odometry of Intelligent Vehicles using Feedforward Neural Networks

Hassan Wagih , Mostafa Osman , Mohamed I. Awad , Sherif Hammad

分类：计算机视觉 | 机器人

2022-07-02

在本文中，提出了一种基于进发神经网络的方法来减少单眼视觉探针算法漂移的方法。视觉轨道图算法计算连续摄像机框架之间车辆的增量运动，然后集成这些增量以确定车辆的姿势。提出的神经网络减少了车辆的姿势估计中的误差，这是由于特征检测和匹配，摄像机固有参数等不准确而导致的。这些不准确性传播到对车辆的运动估计，从而导致大量估计误差。降低神经网络的漂移基于连续的摄像头框架中特征的运动来识别此类错误，从而导致更准确的增量运动估计值。使用KITTI数据集对拟议的漂移减少神经网络进行了训练和验证，结果表明，所提出的方法在减少增量方向估计中的误差方面的疗效，从而减少了姿势估计中的总体错误。

translated by 谷歌翻译

Multimodal Event Graphs: Towards Event Centric Understanding of Multimodal World

Hammad A. Ayyubi , Christopher Thomas , Lovish Chum , Rahul Lokesh , Yulei Niu , Xudong Lin , Long Chen , Jaywon Koo , Sounak Ray , Shih-Fu Chang

分类：计算机视觉 | 自然语言处理

2022-06-14

了解多媒体内容中描述或显示的事件彼此相关是开发可用于真实世界媒体的强大人工智能系统的关键组成部分。尽管许多研究专门用于文本，图像和视频域中的事件理解，但没有一个研究探索事件跨域中经历的复杂关系。例如，新闻文章可能会描述“抗议”事件，而视频显示“逮捕”事件。认识到视觉“逮捕”事件是更广泛的“抗议”事件的一个子事件，这是一个具有挑战性但重要的问题，但前面的工作尚未探讨。在本文中，我们提出了多模式事件关系关系的新任务，以识别这种跨模式事件关系。我们贡献了一个大规模数据集，该数据集由100K视频新文章对组成，以及密集注释的数据的基准。我们还提出了一种弱监督的多模式方法，该方法将来自外部知识库（KB）的常识性知识整合在一起，以预测丰富的多模式事件层次结构。实验表明，我们的模型在我们提出的基准上优于许多竞争基线。我们还对模型的性能进行了详细的分析，并建议未来研究的方向。

translated by 谷歌翻译

Finite-sample analysis of identification of switched linear systems with arbitrary or restricted switching

Shengling Shi , Othmane Mazhar , Bart De Schutter

分类：机器学习

2022-03-18

为了识别具有测量开关信号的开关系统，该工作旨在分析切换策略对估计误差的影响。假定识别数据是从全球渐近或边缘稳定的开关系统中收集的开关中，该系统是任意或受到平均停留时间约束的。然后由最小二乘（LS）估计器估算开关系统。为了捕获开关策略参数对LS估计误差的影响，在这项工作中开发了有限样本误差界。获得的误差边界表明，仅有稳定模式时，估计误差是开关参数的对数。但是，当有不稳定的模式时，随着开关参数的变化，估计误差界限可能会线性增加。这表明在存在不稳定模式的情况下，应正确设计开关策略，以避免估计误差的显着增加。

translated by 谷歌翻译